阿里云张毅萍:构建边缘云全站加速网络体系
凌云时刻
2021年6月9日,亚太内容分发大会暨CDN峰会在北京举行,阿里云边缘云网络高级技术专家张毅萍受邀参会,分享了阿里云在构建边缘云全站加速网络体系的实践,基于边缘云节点支撑各种应用协议的分层传输加速,为差异化的企业应用提供广覆盖的网络加速基础服务。
张毅萍认为:速度是互联网业务中广受关注的业务指标,速度产生价值。视频与互动交互的场景下,速度对应的视频秒开率、播放卡顿率、视频清晰度、交互时延直接影响用户体验和留存;金融与电商交易场景下,每笔交易的请求响应速度以及成功率关系高价值业务运行;全站业务对接场景下,一站式加速对接可大幅提升了业务对接效率是关键。
从内容加速到全站加速
全站加速是从内容加速升级而来。内容加速主要是静态内容的加速,例如视频点播、文件下载。CDN通过大量节点提升用户请求效率和带宽的承载能力,基于缓存实现加速。除了视频点播、文件下载、静态网页这类可较长时间缓存的业务,大量对实时性业务出现,需要更加依赖真正的网络加速而非就近静态缓存带来的体验加速,例如网络游戏、金融交易、实时音视频通信等。
基于边缘云节点的统一选路调度是关键
选路调度的本质是在差异化的客户业务/场景/资源,实现全局的性能/成本最优。资源即节点、网络,单个节点包含CPU算力、内存容量、存储IO、网络IO等;业务是长视频、短视频、下载、直播、金融交易、边缘渲染等等;场景包括缓存内容(消耗存储容量/IO、网络IO)、动态内容(消耗网络IO、CPU算力)、流量计算(消耗CPU算力、内存容量);
选路调度可以理解为就是一种实时动态求解的过程,保证服务质量的前提下,尽可能把每种类型的资源都能够均匀的消耗,尤其是边缘云节点CPU算力资源的有效利用。
智能协议栈是提升服务质量的基础
结合业务、场景、环境差异匹配更适合的传输协议栈,可以缩小不同资源的服务差异性。在协议栈优化的场景中,划分为末端链路、中间链路、回源链路。
面向终端,充分利用终端环境的数据差异,驱动匹配出最适配的传输算法。终端访问时的网络环境、业务类型、时间等方面的差异体现不同服务质量,传输协议匹配是最有效的优化质量的手段,同时还能够优化网络成本。
大规模的链路收敛,追求传输质量和稳定性最优,允许牺牲部分成本,对抗公网传输的波动和干扰,实现链路容灾。
全链路诊断是实现故障快速定位和快速恢复的基石
从业务视角快速检测和定位异常点,提升异常恢复速度、提升运维效率,可分为两类检测:
包括TCP的打标数据统计,从七层业务切入,基于业务层Request/Response维度的打标跟踪,七层转四层时根据七层业务打标执行包染色,中间链路各类网关的染色包统计上报,到最后基于统计数据进行异常点诊断。
借助大量的终端反馈最终用户视角的服务质量,通过自有的千级节点的精细化相互探测,联动异常自动化处置,此外还可以借助第三方播测平台来获得第三方视角的服务质量评定。
最终,将原来三/四/七层独立的质量检测升级为三/四/七层贯穿关联,形成全站加速全链路质量的全局视角。
打造体系化的安全防护能力
在谈及网络安全时,最先想到的就是DDoS之类的流量攻击,这作为基本能力肯定是需要具备的,是属于资源型的能力,单节点没有几百G的带宽储备,很难形成有效的抗D能力。阿里云具有足够防流量攻击的资源池。
张毅萍指出:除了资源侧防护,还需要构建安防体系,尤其是针对动态内容的安全防护,动态加速内容具有请求带宽小、业务价值大的特点,相比最基本的暴力流量攻击,针对动态内容,更多的是爬虫管理、业务防刷等功能。例如,电商网站的各种价格、下单等都是大量的动态内容数据,会面对爬虫、刷单等情况比较多,需要做的防护也更多是针对这些来做的。通过建立起一套完整的安防数据分析体系,与客户在业务层面做深度合作,共同定义什么样的动态请求是正常的,什么样的是异常的,以及不同业务的异常的请求都有哪些特征,如何应对才能尽可能提高安防能力的同时降低误伤概率。
安全防护体系的建立需要依靠攻防积累下来的技术和策略,而这才是最有价值的。
网络加速的核心能力也是打造边缘云体系的基础。在各个边缘应用场景下,底层网络的加速、多云之间的互联互通,可以帮助构建边缘云生态,接口标准化、跨网络的协同、跨云的业务部署,给上层业务提供更广阔、通用的基础设施能力。
演讲最后,张毅萍表达面向未来发展看法:在边缘云生态的发展中,零散的基础资源交付会越来越难以执行,场景应用解决方案式交付会是主流方向,开放合作共赢必将是主旋律,期待加强产业合作,共创边缘云生态。
每日收获前沿技术与科技洞见投稿及合作请联系邮箱:lingyunshike@163.com